# -*- coding: utf-8 -*-
"""
Created on Fri Nov 24 16:15:02 2017

@author: deanchen
"""

import re #正则模块，用来匹配图片地址
import urllib #用来获取HTML源码
import sys #解决文字编码问题
reload(sys)
sys.setdefaultencoding('utf8')


def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html #返回HTML 源码
    
def getImg(html,x):
    reg = r'src="(https://img.*?\.jpg)"'#image 的正则表达式，取括号中的内容
    imgre = re.compile(reg)
    imgList = re.findall(reg,html)
    print imgList
    for i in imgList:
        print i
        print x
        urllib.urlretrieve(i,'download/Slamdunk/%s.jpg' % x) #下载到当前目录下的文件，用数字作为名字
        x += 1
    return x #将x返回，是为了下次再调用GetImg()的时候，x可以接着上一次的继续累加

x =1 
#url = 'http://tieba.baidu.com/p/3466236659?pn='#全智贤
#url = 'https://tieba.baidu.com/p/5447798823?fid=17859?pn=' #科比
url = 'https://tieba.baidu.com/p/3728082928?pn=' #灌篮高手
#多页
for k in range(1,4):
    imgUrl = url + str(k)
    print imgUrl
    html = getHtml(imgUrl)
    x = getImg(html,x) #这个写法再思考一下，前面不写x不行，第二页会从1开始计数

    


